R语言grep函数用法

您所在的位置:网站首页 grep函数 R R语言grep函数用法

R语言grep函数用法

2023-06-15 17:26| 来源: 网络整理| 查看: 265

函数⽤法

   

通常被⽤来进⾏数值计算⽐较多,字符串处理相对较少,⽽且关于字符串的函数也不多,⽤得多的就是

substr

strsplit

paste

regexpr

这⼏个了。实际上

R

关于字符串处理的功能是⾮常强⼤的,因为它甚⾄可以直接使⽤

Perl

的正则表达式,这也是

R

的⼀个理念,作为语⾔就把向量计算做到极致,作为环境,就在各

领域都集成最好的。

R

中有

grep

系列的函数,可以⽤最强⼤的⽅式处理字符串的所有问题。

grep的全称是global search regular expression and print out the line,是Unix下⼀种强⼤的⽂本搜索⼯具,可以通过正则表达式搜索

⽂本,并把匹配的⾏打印出来,包括grep、egrep和fgrep(egrep是扩展的grep,fgrep是快速的搜寻⽅式并没有真正利⽤正则表达

式)。Linux下使⽤GNU版的grep,该套规范也被⼴泛地使⽤,R中的grep函数就是其中之⼀。

  grep的核⼼就是正则表达式(Regular Expressions,通常缩写为regex),所谓正则表达式,就是⽤某种模式去匹配⼀类字符串的⼀

个公式,很多⽂本编辑器或者程序语⾔都⽀持该⽅式进⾏字符串的操作,最开始是由上⽂介绍的Unix⼯具grep之类普及的,后来得到⼴泛

应⽤。尤其是Perl语⾔中将正则表达式发挥到了极致。

  R

语⾔中的

grep

函数可以在给定的字符串向量中搜索某个⼦字符串。

grep

函数可以像数据库查询⼀样对向量中的具有特定条件的元素进⾏查询。

其语法格式如下:

grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE, invert = FALSE)

各参数的含义如下:

(1)pattern: 字符串类型,正则表达式,指定搜索模式,当将fixed参数设置为TRUE时,也可以是⼀个待搜索的字符串。

(2)x : 字符串向量,⽤于被搜索的字符串。

(3)ignore.case: 是否忽略⼤⼩写。为FALSE时,⼤⼩写敏感,为TRUE时,忽略⼤⼩写。

(4)perl: ⽤于指定是否Perl兼容的正则表达式

(5)value:逻辑值,为FALSE时,grep返回搜索结果的位置信息,为TRUE时,返回结果位置的值。

(6)fixed:逻辑值,为TRUE时,按pattern指定的字符串进⾏原样搜索,且会忽略产⽣冲突的参数设置。

(7) useBytes:逻辑值,如果为真,则按字节进⾏匹配,⽽不是按字符进⾏匹配。

(8)invert:逻辑值,如果为TRUE,则返回未匹配项的索引或值。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3